AI032
Программирование массово параллельных процессоров: Практический подход
Оптимизация памяти и тайлинг общей памяти
Цели обучения
- Понять иерархию памяти графического процессора и характеристики задержек
- Выявить шаблоны объединения глобальной памяти
- Реализовать стратегии тайлинга 1D и 2D с использованием общей памяти
- Анализировать и устранять конфликты в банках общей памяти
- Сравнить прирост производительности при тайлинге по сравнению с необработанными реализациями